# cargar librerías a trabajar
library(ggplot2)
library(dplyr)UCV-Escuela Economía- Estadística 1
Ejercicio Práctico
Estadística Descriptiva
Leer los datos
Desde el repositorio del curso ubicado en repositorio datos
# gapminder 2007
gap_2007 <- read.csv('https://raw.githubusercontent.com/javendaXgh/ucveconomiaestadistica1-2-2025/refs/heads/main/data/gap_2007.csv')
# notas quiz1
quiz1<- read.csv('https://raw.githubusercontent.com/javendaXgh/ucveconomiaestadistica1-2-2025/refs/heads/main/data/quiz1.csv')
# encuesta Estadística 1-2025 UCV
df_encuesta <- read.csv('https://raw.githubusercontent.com/javendaXgh/ucveconomiaestadistica1-2-2025/refs/heads/main/data/df_curso.csv')Inspeccionar conjunto de datos
- Media
- Mediana
- Histograma
- Gráfico de caja boxplot(boxplot)
- Medidas de dispersión
- Rango
- Cuartiles
# revisar conjunto de datos
gap_2007# cantidad observaciones
nrow(gap_2007)gap_2007$lifeExp# ordenar valores ascendentemente
sort(gap_2007$lifeExp)# asignar a una variables
expect_vida <- sort(gap_2007$lifeExp)# revisar valores
expect_vida# media o promedio
mean(expect_vida)# mediana
median(expect_vida)# mitad de los datos en el valor
nrow(gap_2007)/2# valores en la mitad
expect_vida[71]expect_vida[72]# calcular la mediana para cantidades pares en el número de observaciones
(expect_vida[71] + expect_vida[72] )/2# tabla resumen de una columna
summary(gap_2007$lifeExp)# tabla resumen de los valores expect_vida
summary(expect_vida)# tabla resumen de pib per cápita
summary(gap_2007$gdpPercap)# histograma con RBase para la PIB per cápita
hist(gap_2007$gdpPercap)# histograma para expectativa de vida
hist(expect_vida, col='orange')# en otro color
hist(expect_vida, col ='blue')# añadir línea media
hist(expect_vida, col ='blue')
abline(v = mean(expect_vida), col = "red", lwd = 2, lty = 2)# añadir línea mediana
hist(expect_vida, col ='blue')
abline(v = mean(expect_vida), col = "red", lwd = 2, lty = 2)
abline(v = median(expect_vida), col = "green", lwd = 2, lty = 2)# obtener desviación típica
desviacion_tipica <- sd(expect_vida)
# llamar (ver el valor asignado a la variable)
desviacion_tipica# calcular 1 desviación de la media por encima
desviacion_1pos <- mean(expect_vida)+ 1*desviacion_tipica
desviacion_1pos# calcular 1 desviación de la media por debajo
desviacion_1neg <- mean(expect_vida)- 1*desviacion_tipica
desviacion_1neg# calcular dos desviaciones
desviacion_2pos <- mean(expect_vida)+ 2*desviacion_tipica
desviacion_2neg <- mean(expect_vida)- 2*desviacion_tipica
desviacion_2pos
desviacion_2neg# graficar una desviación de la media
hist(gap_2007$lifeExp, col ='blue')
abline(v = mean(expect_vida), col = "red", lwd = 4, lty = 2)
abline(v = desviacion_1pos, col = "orange", lwd = 3, lty = 2)
abline(v = desviacion_1neg, col = "orange", lwd = 3, lty = 2)
#abline(v = -sd(gap_2007$lifeExp), col = "orange", lwd = 2, lty = 2)# graficar dos desviaciones de la media
hist(gap_2007$lifeExp, col ='blue')
abline(v = mean(expect_vida), col = "red", lwd = 4, lty = 2)
abline(v = desviacion_1pos, col = "orange", lwd = 3, lty = 2)
abline(v = desviacion_1neg, col = "orange", lwd = 3, lty = 2)
abline(v = desviacion_2pos, col = "purple", lwd = 3, lty = 2)
abline(v = desviacion_2neg, col = "purple", lwd = 3, lty = 2)Gráficos con sistema ggplot para ir del gráfico de puntos al gráfico de caja pasando por el histograma
# variable en estudio: notas del quiz1
variable_estudio <- quiz1
nombre_variable <- 'Notas Quiz1'variable_estudionombre_variableggplot(data=variable_estudio,
aes(x=quiz1,y=0)) +
geom_point()ggplot(data=variable_estudio,
aes(x=quiz1)) +
geom_dotplot()# cambio en el ancho del punto
ggplot(data= variable_estudio,
aes(x=quiz1)) +
geom_dotplot(binwidth=2,
fill="blue") +
xlab(nombre_variable) +
ylab("Frecuencia")# pasar al histograma
ggplot(data=variable_estudio,
aes(x=quiz1)) +
geom_histogram(binwidth=1,
fill="blue") +
xlab(nombre_variable)# asignar colores por una variable categórica
ggplot(data=gap_2007,
aes(x=lifeExp,
fill=continent)) +
geom_dotplot(binwidth=1) +
xlab('Expectativa de Vida') +
ylab("Frecuencia") +
ggtitle("Dotplot de la Expectativa de Vida por Continente ")ggplot(data=gap_2007,
aes(x=lifeExp,
fill=continent)) +
geom_histogram() +
xlab('Expectativa de Vida') +
ylab("Frecuencia") +
ggtitle("Dotplot de la Expectativa de Vida por Continente ")
ggplot(data=gap_2007,
aes(x=lifeExp,
fill=continent)) +
geom_histogram(bins=6) +
xlab('Expectativa de Vida') +
ylab("Frecuencia") +
ggtitle("Dotplot de la Expectativa de Vida por Continente ")# cambio en el ancho del puntonota_mediana <- median(variable_estudio$quiz1, na.rm = TRUE)
nota_medianaggplot(data=variable_estudio,
aes(x=quiz1,y=0)) +
geom_point() +
geom_vline(xintercept =nota_mediana,
color = "red",
linetype = "dashed", # Tipo de línea (e.g., "solid", "dotted")
linewidth = 1)boxplot(variable_estudio$quiz1, horizontal = TRUE)boxplot(variable_estudio$quiz1)ggplot(data=gap_2007,
aes(x=lifeExp,y=0)) +
geom_point() +
geom_vline(xintercept =median(gap_2007$lifeExp),
color = "red",
linetype = "dashed", # Tipo de línea (e.g., "solid", "dotted")
linewidth = 1)+
geom_vline(xintercept =mean(gap_2007$lifeExp),
color = "blue",
linetype = "dashed", # Tipo de línea (e.g., "solid", "dotted")
linewidth = 1)boxplot(gap_2007$lifeExp, horizontal = TRUE)boxplot(gap_2007$lifeExp)hist(expect_vida)
abline(v = mean(expect_vida), col = "blue", lwd = 2, lty = 2)
abline(v = median(expect_vida), col = "red", lwd = 2, lty = 2)Trabajar con nuestros Datos
df_encuesta| peso | altura | Edad | hermanos | cod.postal | sexo | dia.nacionmiento | hijos | distancia | tranporte | trabaja | materias.cursadas | horas.estudio | promedio.acad | red.social | consumo.drogas | hora.registro |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> | <lgl> |